哪种统计软件最受政治学者欢迎?|【政治学研究方法教学论】圆桌论坛
编者按
在学习研究方法时,我们常常会参考各式各样的教材,而这些教材又会基于不同的统计软件进行编写,例如,Excel、SPSS、Stata、R,以及近年来网课铺天盖地、颇为火热的Python,不一而足。因此,我们不可避免地会陷入到了这样一种困局中,即我是不是需要多掌握几种软件,从而能够充分应对研究中对统计模型的需要呢?
因此,我们不禁想问,对于政治学者来说,哪种软件最受喜爱呢?在高校教学中,我们最常教授的是哪种软件?因此,我们编译了这篇发言稿。三名作者基于不同层级高校的方法类课程大纲进行了统计分析,发现了一些有趣的现象,例如:R及RStudio最受学者们欢迎,也常常被用于课堂教学中,Python的使用频率反而最少。但是,R同时也是与Python一样有着较高的上手成本,被认为是“望而生畏”。当然,R陡峭的学习曲线也意味着虽然在刚刚接触时感到艰深,但随着慢慢接触而融会贯通。除此之外,这篇文献还介绍了一些适合研究方法的学习方式。
哪种统计软件最受政治学者欢迎?
(原标题为:《将统计软件的使用融入本科政治方法论课程(Integrating the Use of Statistical Software into Undergraduate Political Methodology Courses)》,现标题为译者所拟)
从左至右依次为David S. Brown、
Katherine V. Bryant、Andrew Q. Philips
作者:
David S. Brown, University of Colorado
Katherine V. Bryant, Westmont College
Andrew Q. Philips, University of Colorado
译者:
焦磊,山东大学
引文格式(MLA):
Brown, David S., et al. “Integrating the Use of Statistical Software into Undergraduate Political Methodology Courses.” PS: Political Science & Politics, vol. 55, no. 1, 2021, pp. 210–15.
“有明显的证据表明,政治方法论课程受到院系和机构的高度重视;超过73%的调查受访者和59%被编码分析的教学大纲显示,他们的课程是主要必修课程。”
“我的学生讨厌Stata……但我认为他们对任何我布置的统计软件都会感到厌烦。”
“面对教授政治方法论课程所带来的挑战与复杂性,政治科学必须积极支持教师们。”
广泛认为统计学、编程、数据科学和分析技能为学生在就业市场和未来职业生涯中提供了战略优势。美国统计协会预测,到2021年,70%的企业领导者将更倾向于选择具备数据科学技能的候选人。这一需求预期将持续增长,在过去五年中有28%的增长预期。要求编码技能的工作平均每年比不需要此类技能的工作多支付约22000美元,近一半年薪超过58000美元的工作至少需要一定程度的编码能力。鉴于这一趋势,高等教育增设了数据科学领域的学位、项目和课程,并强调学生应增强数据素养。学生们也认识到了这些技能的实用性,因为如今在教育、医疗保健、非营利组织甚至葡萄酒行业等商业和自然科学领域之外的工作中,这些技能常常成为必需条件。
然而,在我们的学科领域中,教授本科政治方法论课程仍是一项艰巨任务;教师必须指导学生成为政治知识的作者、读者和创造者。尽管这些课程已经存在了几十年,但对数据分析和数据素养的日益重视使得研究方法课程面临着传授这些技能的更大压力。情况进一步复杂化的是,在政治科学家之间关于在这些课程中使用数据软件、技能和方法的共同讨论很少。作为一个学科,尽管我们认识到在本科生中提高数据素养的需求日益增加,但在我们自身的教学讨论中似乎并未对此给予太多关注。
认为研究方法论缺乏坚实的教学基础的批评并非新鲜事。先前的研究已认识到虽然方法课程对学生来说往往具有极高的学术挑战性,但关于该主题的讨论却相对匮乏。例如,Wagner、Garner和Kawulich指出,研究方法的讲师“似乎完全不涉及教学法问题”。这并不意味着社会科学和政治科学方法论中的教学讨论不存在。然而,事实上,对于本科政治方法论教师的指导资源非常有限。随着越来越多的学生认识到这些课程的好处,迫切需要深化对教学方法最佳实践的理解。
本文通过解决以下两个问题填补了这一空白:(1)统计软件如何融入本科政治方法论课程?;(2)这些课程是如何组织和教授的?我们通过两种不同的方法回答这些问题。首先,一组研究助理从美国新闻与世界报道根据排名所划分的不同机构中收集并编码了来自78个不同机构(其中一些机构有两份或以上教学大纲被包含在内)的93份本科政治方法论课程教学大纲信息。在这93份教学大纲中,有25份来自南部,24份来自北部,9份来自东部,35份来自西部。其次,我们在2021年1月依赖于一项匿名调查——该调查在PolMeth电子邮件列表服务以及Facebook上的“Political Scientists”私人小组页面上进行宣传——对象是曾在本科阶段教授过政治方法论课程的讲师。我们收到了超过140份回复,受访者来自R1(占53%)、R2(11%)和R3类机构(9%),以及文理学院(26%)和社区学院(0.7%)。通过这两项原始数据来源,我们不仅提供了关于统计软件如何融入政治方法论课程的广泛概述,还展示了它是如何向学生呈现的。最后,我们为这些课程的教师提供了建议。
软件
教师是否在政治方法论课程中使用软件,如果使用,又是哪种类型的软件?我们首先通过分析这些方法论课程是否为政治学专业必修课来展开研究。有明显证据表明,政治方法论课程受到院系和机构的高度重视;超过73%的调查受访者以及59%被编码的教学大纲显示,他们的课程是主修要求课程。我们的教学大纲编码还揭示了根据学校类型和地理位置而产生的有趣差异。图1显示,区域大学更有可能要求学生修读方法论课程,其次是文理学院和全国性大学。此外,62%的私立机构要求修读方法论课程,相比之下,公立机构的比例稍低,仅为57%。最后,中部地区的机构相比沿海地区更可能要求这些课程(64%对54%)。
图1 按机构类型划分的课程要求
表1详细总结了各种使用的软件类型。我们的教学大纲编码显示,超过80%的课程至少会使用某种统计软件。R及/或RStudio是最常用的,其中29%的教学大纲和60%的调查受访者表示他们在课堂上使用了这一工具。R之所以受欢迎的一个解释可能是成本因素;相当数量的调查受访者指出,成本优势是使用R的主要原因之一,同时R活跃的在线社区也为使用者提供了必要的帮助。部分使用Excel的受访者也提到,通过所在大学,Excel通常对学生来说是免费的。接下来最常用的是Excel、Stata和SPSS(根据调查数据)——或者按照教学大纲的数据则是SPSS、Stata和Excel——它们在课堂中的使用率介于9%至30%之间。相比之下,Python在政治方法论课程中极少被教师采用。
表1 软件应用模式
我们的调查还询问了受访者认为在政治方法论课程中最常使用的软件是什么。如表1所示,尽管教师们对其它软件使用频率的估计存在一些偏差(他们似乎高估了SPSS的使用频率,并低估了R和Excel的使用频率),但总体而言,他们的判断较为准确。我们还向受访者询问他们是否会向同事推荐所选用的软件;大部分受访者会推荐Excel、Python、R和Stata,大约60%的受访者会推荐使用SPSS。在调查中,受访者普遍表达的一种观点是,选择某类特定软件的原因在于其不仅在课堂和学术界有用,而且在工业界也有潜在价值。这种观点在R用户中最为常见,但也有其他受访者为Stata、SPSS和Excel提出相同的论点。
尽管R(或Python)很受欢迎,但其常被提及的一个缺点是学习曲线陡峭。调查受访者称其为“难以掌握”、“令人望而生畏”和“极其困难”。然而,对于不熟悉界面的人来说,除了Excel之外的所有软件可能都会显得陌生。正如一位受访者生动地表示:“我的学生讨厌Stata……但我认为他们会对任何我指定的统计软件都感到厌烦。”根据我们的经验,在课程开始的前几周专注于指导学生下载、安装以及展示基本功能(例如设置工作目录和如何打开与保存文件),有助于学生适应界面。带有嵌入或附带代码的教科书对学生也很有帮助。
我们还发现,近三分之一的调查受访者在单个课程中使用了多种软件。正如一位讲师所言,这种策略“允许学生根据相同的科学知识指导,使用他们已有的任何软件。”考虑到学生可能已经熟悉某种类型的统计软件,这种方法在现实世界中可能更为灵活且更切实际;作为研究人员,我们当然不会仅限于单一软件。这种方法的缺点包括教师需要精通所有软件,以及在课堂上分配时间讨论不同软件中执行相同功能的不同方式的问题。与此相关的是,显然对软件的熟悉度是非常可取的。正如一位受访者对其首选软件的评价:“这是我最熟悉的软件,因此当他们遇到问题时,我很容易进行故障排除。”考虑到学习新系统所需的时间和精力,对于教师来说,转向另一种统计程序无疑是一项挑战。
结构和主题
本科方法论课程是如何构建和教授的?为了解答这个问题,我们考察了教师所涵盖的主题、课程级别与规模以及使用的评估类型。如表2所示,大多数课程中包含研究设计、统计学和数据科学等主题。然而,在同一类别内部往往存在显著差异。例如,根据我们的调查分析,94%的课程讨论描述性统计学,而只有18%涵盖方差分析(即ANOVA/ANCOVA)技术。近60%的方法论课程讨论如何管理数据集,88%涉及图形,但只有29%明确包含了编程内容。我们的教学大纲分析在诸如一般假设检验、概率论和回归等多个类别中的比例更低。然而,大多数教学大纲涵盖了研究设计和因果推断的元素,并且超过一半包含了认识论的讨论。
表2 包含的主题
图2展示了关于课程级别和规模的调查结果。虽然也有其他级别的课程,但最多的是中级本科课程。课程的班级规模也存在较大差异,从研讨式的小型8人班到700人的大课不等(中位数为29人)。大型课程更倾向于出现在初级本科阶段,平均有37名学生,而高级本科课程的平均人数则为20人。
图2 课程级别
最后,我们研究了这些方法论课程中教师采用的各种评估方式。表3显示,大多数课程包括个人作业、实验或习题集以及某种形式的考试。研究论文也是一种常见的评估方式。较少采用的是小组作业或习题集以及演示报告。显然,个人作业或实验可能很有用;然而,我们的经验表明,小组作业——我们更倾向于三人一组的方式——是一种很好的让学生通过互相帮助来学习的方式。每周或每两周一次的小组作业,建立在前一周的基础之上,既能够增加知识储备,又能在先前作业的基础上提供对软件的熟悉度。例如,某一周的任务可能涉及双变量可视化(如散点图),而下一周的作业要求添加一个额外的变量(如用颜色、形状或大小代表额外维度的散点图)。此外,我们认为演示报告是让学生练习组织并阐述其数据分析成果的好方法,尽管对于较大的班级规模而言,这类机会可能会受到限制。
表3 评估类型
结论:软件的成功应用
正如统计软件极大地改变了政治学领域一样,它也革新了课堂教育,特别是在方法论课程中。我们认为这是一个进步,尽管将这些工具融入课程是一项具有挑战性的任务。我们的分析结果显示,这些课程的结构以及所使用的软件存在很大的差异性。此外,我们不能忽视在支持和资源方面为这些课程提供的实质性变化程度。虽然我们的调查显示许多受访者有接触到助教和实验课的机会,但我们分析的大多数教学大纲并未反映出同样的资源配置。鉴于教师在教授这类课程时面临的高要求,对这一差异进行进一步研究是合理的。
基于我们自身及同行的经验,我们提供一些关于统计软件方面的总体建议和最佳实践。首先,学习统计编程与学习统计本身之间存在张力,两者并不相同。一部分学生热衷于掌握编程的每一个细节,而另一部分则对此感到厌恶。还有一些学生本就不愿学习统计学,常常抱怨“我不是来上数学课的!”因此,在教学过程中明确课程目标和结构对于学期初就缓解紧张氛围极为重要。教师还应注意,不同的软件包和编程语言适合采用不同的学习方式;有些需要更高的初期投入。当教师公开讨论某一程序或软件包的优点和缺点以及选择它们的原因时,可以减轻学生的抵触情绪和挫败感。我们经常在开学第一天通过搜索“R语言工作机会”向学生证明投资于这些具有市场价值的技能是值得的。
第二,由于并非所有学生都能读懂数学表达式并准确理解其含义(尤其是在必修的政治科学课程中),因此提供多种学习途径至关重要。一些学生更倾向于简单明了的语言指导,逐步引导他们完成整个过程;而其他学生则更偏向视觉学习,能够快速通过实例掌握命令和图形技术以生成估计值。鉴于学生学习方式的广泛差异,提供不同方式来探索如何使用软件显得十分重要,同时拥有多种学习资源也是有益的。网络上有良好支持且积极维护更新的软件包和语言特别有助于学生自学。教师应明确指出,学生需要培养的一种课程技能就是自我寻找答案的能力,答案不一定只存在于同一本教材或网站上。教会学生如何在线搜索帮助不仅对他们自身有益,也能减轻教师的教学负担。
第三,我们倡导翻转课堂或半翻转课堂等主动而非被动的教学模式,即采取活跃的教学方式。实验证据表明,这样的教学模式能促进学习,尽管可能会降低学生满意度。这要求将讲座内容浓缩到较少的课时内(或者将部分内容完全转移到线上,作为预录讲座)。然而,将课程时间用于个人或小组使用软件完成作业,可以帮助解决小的编码问题,这些问题可以通过教师轻松解决,从而减少学生的挫折感。另外,尤其在小班规模下,涉及全班同学的研究项目可能是与学生互动的最佳方式。
第四,学生学习软件的能力依赖于观察(“代码不起作用!”)、形成假设(“可能只是打错了字”)和测试假设(“修改拼写后重新运行命令”)。这是对学生在使用软件过程中如何学习和实践科学方法的一个简化示例。尽管这与“吃药时配上糖丸”不尽相同,但如果正确实施——例如明确学习目标——学生会发现自己的问题解决能力得到了提升。
尽管本科方法论课程存在多样性,但一个普遍的主题是对其需求的增长。因此,政治学必须致力于支持教师应对教授政治方法论课程所带来的挑战和复杂性。加强教学对话、分享最佳实践,并创建在线资源库,这些都是推动对这些核心课程采取更为全面和支持性方法的众多步骤之一。
(因篇幅限制,参考文献从略)
〇 编辑、排版:焦磊
〇 审校:郭瑞涵 大兰